CUDA學習(五)之使用共享內存(shared memory)進行歸約求和(一個包含N個線程的線程塊)
共享內存(shared memory)是位於SM上的on-chip(片上)一塊內存,每個SM都有,就是內存比較小,早期的GPU只有16K(16384),現在生產的GPU一般都是48K(49152)。 ...
共享內存(shared memory)是位於SM上的on-chip(片上)一塊內存,每個SM都有,就是內存比較小,早期的GPU只有16K(16384),現在生產的GPU一般都是48K(49152)。 ...